No todo desacuerdo es aprendible: Enseñabilidad de tokens en destilación on-policy <meta name=description content=Explora por qué no todo desacuerdo de tokens es aprendible en destilación on-policy. Implicaciones clave para modelos de lenguaje.> 2026-05-27 · 2 min